home *** CD-ROM | disk | FTP | other *** search
/ BCI NET 2 / BCI NET 2.iso / archives / demos / misc / prosite.lha / Prosite / data / PDOC00126 < prev    next >
Encoding:
Text File  |  1995-03-04  |  5.5 KB  |  112 lines

  1. ******************************************************
  2. * Eukaryotic thiol (cysteine) proteases active sites *
  3. ******************************************************
  4.  
  5. Eukaryotic thiol proteases (EC 3.4.22.-) [1]  are  a  family  of   proteolytic
  6. enzymes which contain an active site cysteine.   Catalysis  proceeds through a
  7. thioester intermediate and is facilitated by a nearby histidine side chain; an
  8. asparagine completes the essential catalytic triad.  The  proteases  which are
  9. currently  known  to belong  to  this  family are listed below (references are
  10. only provided for recently determined sequences).
  11.  
  12.  - Vertebrate  lysosomal  cathepsins B   (EC 3.4.22.1),   H  (EC 3.4.22.16), L
  13.    (EC 3.4.22.15), and S (EC 3.4.22.27) [2].
  14.  - Vertebrate lysosomal  dipeptidyl  peptidase I (EC 3.4.14.1)  (also known as
  15.    cathepsin C) [3].
  16.  - Vertebrate calpains  (EC 3.4.22.17).   Calpains  are intracellular calcium-
  17.    activated thiol  protease that contain  both  a N-terminal catalytic domain
  18.    and a C-terminal calcium-binding domain.
  19.  - Bleomycin hydrolase.  An  enzyme that  catalyzes  the  inactivation  of the
  20.    antitumor drug BLM (a glycopeptide).
  21.  - Plant enzymes: barley aleurain (EC 3.4.22.16), EP-B1/B4; kidney bean EP-C1,
  22.    rice bean SH-EP;  kiwi fruit actinidin (EC 3.4.22.14);  papaya latex papain
  23.    (EC 3.4.22.2),   chymopapain (EC 3.4.22.6),   caricain (EC 3.4.22.30),  and
  24.    proteinase IV (EC 3.4.22.25); pea turgor-responsive protein 15A;  pineapple
  25.    stem bromelain (EC 3.4.22.32); rape COT44;  rice  oryzain  alpha, beta, and
  26.    gamma [4]; tomato low-temperature induced.
  27.  - House-dust mites allergens DerP1 and EurM1.
  28.  - Cathepsin B-like proteinases from the  worms  Caenorhabditis  elegans (gene
  29.    gcp-1) [5], Schistosoma mansoni (antigen SM31), Haemonchus contortus (genes
  30.    AC-1 and AC-2), and Ostertagia ostertagi.
  31.  - Slime mold cysteine proteinases CP1 and CP2.
  32.  - Cruzipain from Trypanosoma cruzi [6] and Trypanosoma brucei.
  33.  - Throphozoite cysteine proteinase (TCP) from Plasmodium falciparum [7].
  34.  - Proteases from Leishmania mexicana, Theileria annulata and Theileria parva.
  35.  - Baculoviruses cathepsin-like enzyme (v-cath) [8].
  36.  - Drosophila small optic  lobes protein (gene sol) [9],  a  neuronal  protein
  37.    that contains a calpain-like domain.
  38.  - Yeast thiol protease BLH1/YCP1/LAP3 [10].
  39.  
  40. Two other proteins are structurally  related to this family, but may have lost
  41. their proteolytic activity.
  42.  
  43.  - Soybean oil body  protein P34 [11].  This  protein   has  its  active  site
  44.    cysteine replaced by a glycine.
  45.  - Plasmodium falciparum serine-repeat protein (SERA),  the  major blood stage
  46.    antigen. This protein of 111 Kd possesses  a C-terminal thiol-protease-like
  47.    domain [12], but the active site cysteine is replaced by a serine.
  48.  
  49. The sequences around the three active site residues are well conserved and can
  50. be used as signature patterns.
  51.  
  52. -Consensus pattern: Q-x(3)-[GE]-x-C-[YW]-x(2)-[STAGC]-[STAGCV]
  53.                     [C is the active site residue]
  54. -Sequences known to belong to this class detected by the pattern: ALL,  except
  55.  for soybean P34, plasmodium SERA antigen, and Theileria annulara protease.
  56. -Other sequence(s) detected in SWISS-PROT: mouse transglutaminase C and lectin
  57.  bra-3 from barnacle.
  58.  
  59. -Note: the residue in position 4 of the pattern is almost always cysteine; the
  60.  only exceptions are calpains (Leu), bleomycin hydrolase (Ser) and  yeast YCP1
  61.  (Ser).
  62. -Note: the residue in position 5 of the pattern is always Gly except in papaya
  63.  protease IV where it is Glu.
  64.  
  65. -Consensus pattern: [LIVMGSTAN]-x-H-[GSACE]-[LIVM]-x-[LIVMAT](2)-G-x-[GSNH]
  66.                     [H is the active site residue]
  67. -Sequences known to belong to this class detected by the pattern: ALL,  except
  68.  for calpains and 4 other thiol proteases.
  69. -Other sequence(s) detected in SWISS-PROT: 30.
  70.  
  71. -Consensus pattern: [FYC]-[WI]-[LIVT]-x-[KRQAG]-N-[ST]-W-x(3)-[FYW]-G-x(2)-G-
  72.                     [FYW]-[LIVMFYG]-x-[LIVMF]
  73.                     [N is the active site residue]
  74. -Sequences known to belong to this class detected by the pattern: ALL,  except
  75.  for  calpains,  bromelain,  yeast BLH1  and  tomato  low-temperature  induced
  76.  protease.
  77. -Other sequence(s) detected in SWISS-PROT: NONE.
  78.  
  79. -Note: the  active  sites sequences of  prokaryotic  thiol  proteases (such as
  80.  clostripain  or  streptococcal  cysteine  protease)   differs  from  that  of
  81.  eukaryotic proteases.
  82.  
  83. -Expert(s) to contact by email: Turk B.
  84.                                 turk@ijs.ac.mail.yu
  85.  
  86. -Last update: June 1994 / Patterns and text revised.
  87.  
  88. [ 1] Dufour E.
  89.      Biochimie 70:1335-1342(1988).
  90. [ 2] Ritonja A., Colic A., Dolenc I., Ogrinc T., Podobnik M., Turk V.
  91.      FEBS Lett. 283:329-331(1991).
  92. [ 3] Kominami E., Ishidoh K., Muno D., Sato N.
  93.      Biol. Chem. Hoppe-Seyler 373:367-373(1992).
  94. [ 4] Watanabe H., Abe K., Emori Y., Hosoyama H., Arai S.
  95.      J. Biol. Chem. 266:16897-16902(1991).
  96. [ 5] Ray C., McKerrow J.H.
  97.      Mol. Biochem. Parasitol. 51:239-250(1992).
  98. [ 6] Eakin A.E., Mills A.A., Harth G., McKerrow J.H., Craik C.S.
  99.      J. Biol. Chem. 267:7411-7420(1992).
  100. [ 7] Rosenthal P.J., Nelson R.G.
  101.      Mol. Biochem. Parasitol. 51:143-152(1992).
  102. [ 8] Kuzio J., Faulkner P.
  103.      EMBL/GenBank: M67451.
  104. [ 9] Delaney S.J., Hayward D.C., Barleben F., Fischbach K.-F., Miklos G.L.G.
  105.      Proc. Natl. Acad. Sci. U.S.A. 88:7214-7218(1991).
  106. [10] Kambouris N.G., Burke D.J., Creutz C.E.
  107.      J. Biol. Chem. 267:21570-21576(1992).
  108. [11] Kalinski A., Weisemann J.M., Matthews B.F., Herman E.M.
  109.      J. Biol. Chem. 265:13843-13848(1990).
  110. [12] Higgins D.G., McConnell D.J., Sharp P.M.
  111.      Nature 340:604-604(1989).
  112.